针对恶意软件分类的持续学习(CL)解决了恶意软件威胁的迅速发展的性质和新型类型的频率出现。生成重播(GR) - 基于CL系统利用生成模型生成过去数据的合成版本,然后将其与新数据结合使用以重新训练主要模型。该领域中的传统机器学习技术通常会在灾难性遗忘中挣扎,在这种情况下,模型在旧数据上的性能随着时间的推移而降低。在本文中,我们引入了一个基于GR的CL系统,该系统将生成的对抗网络(GAN)具有功能匹配损失,以生成高质量的恶意软件样本。在方面,我们根据模型的隐藏表示形式实施了用于播放样本的创新选择方案。我们在课堂知识学习方案中对Windows和Android恶意软件数据集进行了全面评估 - 在多个任务上不断引入新课程 - 证明了对先前方法的实质性改进。例如,我们的系统在Windows恶意软件中的平均准确度为55%,大大优于其他基于GR的模型的平均准确性高出28%。本研究为推进基于GR的恶意软件分类系统提供了实用的见解。该实施可在https://github.com/malwarereplaygan/ malcl 1中获得。
主要关键词